7 de noviembre de 2019

Introducción

Objetivos

Resultados

Concentración de ventas diarias

Distribución de empresas inscritas según provincia, Gran Área Metropolitana, Costa Rica

Resultados

Modelos de regresión

  • Modelo con intercepto variable
  • Modelo con covariable (distancias a centros según provincia)

Resultados

Modelo con el intercepto

mod1<-lm(log(venta_diaria)~1, data = microempresas_data)
summary(mod1)
  
  Call:
  lm(formula = log(venta_diaria) ~ 1, data = microempresas_data)
  
  Residuals:
       Min       1Q   Median       3Q      Max 
  -2.48204 -0.36056  0.07743  0.40834  0.90235 
  
  Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
  (Intercept)  11.6924     0.0153   764.1   <2e-16 ***
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  
  Residual standard error: 0.5591 on 1334 degrees of freedom

Resultados

Modelo con la covariable

mod5<-lm(log(venta_diaria)~dist_centro, data = microempresas_data)
summary(mod5)
  
  Call:
  lm(formula = log(venta_diaria) ~ dist_centro, data = microempresas_data)
  
  Residuals:
       Min       1Q   Median       3Q      Max 
  -2.48891 -0.35350  0.05933  0.41906  1.09174 
  
  Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
  (Intercept) 11.776966   0.025940 454.009  < 2e-16 ***
  dist_centro -0.016251   0.004036  -4.026 5.98e-05 ***
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  
  Residual standard error: 0.5559 on 1333 degrees of freedom
  Multiple R-squared:  0.01202, Adjusted R-squared:  0.01127 
  F-statistic: 16.21 on 1 and 1333 DF,  p-value: 5.985e-05

Resultados

Compración de modelos

anova(mod1, mod5)
  Analysis of Variance Table
  
  Model 1: log(venta_diaria) ~ 1
  Model 2: log(venta_diaria) ~ dist_centro
    Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
  1   1334 416.98                                  
  2   1333 411.97  1    5.0102 16.211 5.985e-05 ***
  ---
  Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se prefiere el modelo con únicamnete el intercepto.

Resultados

Semivariograma por dirección

Resultados

Semivariograma

    model     psill    range
  1   Nug 0.2459544 0.000000
  2   Bes 0.1226058 8.174145

Criterio de dependencia espacial

Usando el criterio del radio de \(\dfrac{nugget}{rango}\) (\(\dfrac{0.24}{0.36}=0.66\))

Es decir, existe una relación espacial moderada

Interpolación

Interpolación de ventas para la GAM

Conclusiones

  • La cercanía al centro urbano no es una buena variable para explicar el proceso estócastico de las ventas diarias de estas empresas, otras variables, como tiempo de permanencia en el mercado o númerode empleados.

  • La transformaciones escogidas para las variables utilizadas no permitieron solucionar los problemas de linealidad.

  • Al obtener un coeficiente de determinación tan bajo (inferior a 10%), indica que el modelo nulo no es adecuado y nuevas covariables tienen que investigarse para mejorar estos resultados.

  • La interpolación realizada captura bien la distribución de las ventas en la GAM, sin embargo, al no estar usándose ninguna covariable, no es posible predecir valores de ventas para lugares con poca muestra como lo es la provincia de Cartago.